AI012

Mendalami Model Bahasa Besar

Agen Otonom, RLHF, dan Penyesuaian Keamanan

Pelajaran

Pelajaran 8

Pengajar

Tutor AI

Analisiskomponen arsitektur agen GUI, termasuk modul perencanaan, pengambilan keputusan, dan refleksi dalam sistem agen ganda.
Jelaskanmekanisme Pembelajaran Penguatan (RL) dan RLHF, khususnya peran model hadiah dan PPO dalam menyelaraskan perilaku agen dengan nilai-nilai manusia.
Evaluasirisiko keamanan dan masalah keandalan pada agen otonom, termasuk kesalahan Out-of-Distribution (OOD), serangan jailbreak, dan gangguan lingkungan.